前言
昨天我們分別介紹了 AI 與 Data 的基本概念。今天,我們要更進一步,探討兩者之間的關係,說明為什麼資料是 AI 的基礎,以及 AI 如何透過資料發揮價值。
一、AI與人類大腦的學習方式
AI 的學習方式,其實很像人類大腦學習新事物的過程。
人類大腦學習:
以辨認動物為例,當我們第一次看到一隻貓,大腦可能只知道「這是一個有毛的生物」,但還不清楚牠的特徵或名稱。
接著,我們會觀察不同的貓或圖片(大隻的、小隻的、黑貓、白貓、花貓......),大腦會注意到貓咪的共通特徵(Features),例如:尖尖的耳朵、長長的鬍鬚、圓圓的眼睛、柔軟的毛皮、彎曲的尾巴......
這些特徵幫助大腦建立「貓咪概念」,即使看到新的貓咪,顏色或大小不同,也能正確辨認。
同時,大人或老師會告訴我們「這是貓咪」,幫助大腦把特徵與名稱建立連結。經過反覆觀察與經驗累積,大腦就能辨認出新的貓咪,即使牠的顏色或形狀不同,也能自信判斷。
AI的學習方式:
AI 的學習過程模仿人腦,但依靠資料(Data)與演算法(Algorithm)。
同樣以辨認動物為例,訓練 AI 來辨認貓咪的過程,其實很像人類學習的過程,過程如下。
1.資料收集(Data Collection):準備大量貓咪圖片,並丟給 AI 很多圖片,並告訴它「這是貓」或「不是貓」。
2.特徵提取(Feature Extraction):AI 自動提取共通特徵,例如耳朵形狀、毛色分布、眼睛位置,這些特徵幫助 AI 建立「貓咪概念」。
3.模型訓練(Model Training):AI 透過演算法(Algorithm)學習如何依據特徵判斷是否為貓。且會調整模型的 權重(Weights) 來降低錯誤率。
4.測試與調整(Validation & Tuning):用新的圖片測試 AI 是否能正確辨認貓,必要時調整模型。
5.推論與應用(Inference & Deployment):訓練完成後,AI 可以對新圖片做推論,即使貓的外觀不同,也能辨認出來。
非 AI 程式學習辨認動物的方法
[方法一]規則導向(Rule-based Approach):程式設計師需要手動定義規則,告訴程式如何辨認動物。
例如:如果耳朵尖且有鬍鬚,且體型小於50公分 → 判斷為貓
優點:邏輯明確、對固定情況準確
缺點:無法應對未定義的情況,例如貓咪姿勢、角度或光線不同時就可能錯誤
[方法二]特徵比對(Feature Matching):程式先抓取圖像的特徵(顏色、形狀、邊緣等),再比對已知模板。
例如:比較圖片中耳朵、眼睛、毛色與模板的相似度。
優點:比純規則彈性稍高
缺點:模板需要人工設計,對光線、角度、背景變化敏感
以上方法之特徵與判斷邏輯都是人工指定,程式不會自行學習
二、AI 與 Data 的關係
透過辨認動物的例子,我們可以清楚看到 AI 與 Data 的關係:
1.Data是AI學習的基礎
就像小孩要學會辨認貓咪,需要看很多貓的圖片,AI 也需要大量資料(Data)來學習。
這些資料可以是圖片、文字、聲音……只要是 AI 可以分析的資訊,都能作為學習素材。
2.Data提供特徵
AI 透過資料找出共通特徵(Features),例如貓的尖耳朵、鬍鬚、眼睛位置等。
如果資料不夠多樣化或不完整,AI 很難學會正確的判斷,就像小孩只看過黑貓,可能看見白貓就認不出來一樣。
3.Data決定AI模型表現
模型(Model)學到的規則,是從Data中學習來的。Data越完整、越正確,模型就越精準。
標註資料(Labelled Data)告訴 AI「這是貓」或「不是貓」,就像老師告訴小孩動物的名稱一樣,幫助 AI 建立正確的概念。
4.AI 是Data的運用
有了資料,AI 才能透過演算法(Algorithm)分析特徵、建立模型、進行推論(Inference)。
沒有資料,AI 就像沒有經驗的小孩,看再多的動物也學不會辨認。
三、名詞解釋
小結
今天我們透過學習辨認動物的例子,理解了 AI 的訓練需要通過資料(Data)來學習。資料提供了特徵(Features),幫助 AI 建立模型(Model)與概念,就像小孩透過觀察和老師的指導學會辨認貓咪一樣。
我們也了解到,資料的完整性與多樣性會影響 AI 模型的準確度。同時,本節也對一些核心名詞做了簡短說明。
理解了這些概念後,後續章節將從機器學習與深度學習開始,逐步說明如何將資料轉化為能做出判斷的模型。